انتخاب اعضای ترکیب در خوشه‌بندی ترکیبی با استفاده از رأی‌گیری

نویسندگان

چکیده مقاله:

Clustering is the process of division of a dataset into subsets that are called clusters, so that objects within a cluster are similar to each other and different from objects of the other clusters. So far, a lot of algorithms in different approaches have been created for the clustering. An effective choice (can combine) two or more of these algorithms for solving the clustering problem. Ensemble clustering combines results of existing clusterings to achieve better performance and higher accuracy. Instead of combining all of existing clusterings, recent decade researchers show, if only a set of clusterings is selected  based on quality and diversity, the result of ensemble clustering would be more accurate. This paper proposes a new method for ensemble clustering based on quality and diversity. For this purpose, firstly first we need a lot of different base clusterings to combine them. Different base clusterings are generated by k-means algorithm with random k in each execution. After the generation of base clusterings, they are put into different groups according to their similarities using a new grouping method. So that clusterings which are similar to each other are put together in one group. In this step, we use normalized mutual information (NMI) or adjusted rand index (ARI) for computing similarities and dissimilarities between the base clustering. Then from each group, a best qualified clustering is selected via a voting based method. In this method, Cluster-validity-indices were used to measure the quality of clustering. So that all members of the group are evaluated by the Cluster-validity-indices. In each group, clustering that optimizes the most number of Cluster-validity-indices is selected.  Finally, consensus functions combine all selected clustering. Consensus function is an algorithm for combining existing clusterings to produce final clusters. In this paper, three consensus functions including CSPA, MCLA, and HGPA have used for combining clustering. To evaluate proposed method, real datasets from UCI repository have used. In experiment section, the proposed method is compared with the well-known and powerful existing methods. Experimental results demonstrate that proposed algorithm has better performance and higher accuracy than previous works.  

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

اثر بربرین در تنظیم آستروسیتهای Gfap+ ناحیه هیپوکمپ موشهای صحرایی دیابتی شده با استرپتوزوتوسین

Background: Diabetes mellitus increases the risk of central nervous system (CNS) disorders such as stroke, seizures, dementia, and cognitive impairment. Berberine, a natural isoquinolne alkaloid, is reported to exhibit beneficial effect in various neurodegenerative and neuropsychiatric disorders. Moreover astrocytes are proving critical for normal CNS function, and alterations in their activity...

متن کامل

انتخاب استراتژی بهینه با استفاده از ترکیب تکنیک‌هایSWOT و FANP

بقا و حیات یک سازمان منوط به تصمیم‌گیری صحیح در مواجه با فرصت‌ها و تهدیدات موجود در محیط بیرونی سازمان می‌باشد. ازآنجایی‌که هیچ سازمانی نمی‌تواند منابع نامحدود داشته باشد استراتژیست ها باید در این مورد که کدام‌یک از استراتژی‌های مختلف می‌توانند بیشترین منفعت را به سازمان برسانند، تصمیم‌گیری نمایند. از طرفی تحلیل SWOT مدیران را قادر به کشف و شناسایی عوامل داخلی و خارجی مؤثر بر استراتژی‌های سازما...

متن کامل

انتخاب سبد سهام فازی با استفاده از الگوریتم هوشمند ترکیبی با در نظر گرفتن ریسک نامطلوب

مطالعات تجربی نشان می‌دهد بازده دارایی‌ها نرمال و متقارن نمی‌باشد، بنابراین واریانس نمی‌تواند به‌درستی به‌عنوان معیار ریسک مناسب مورداستفاده قرار گیرد. در این پژوهش بازده دارایی‌ها به‌عنوان یک عدد فازی در نظر گرفته‌شده است و از معیار ریسک نامطلوب، نیمه واریانس و نیمه قدر مطلق انحراف از میانگین به‌عنوان معیار ریسک استفاده‌شده است. در ادامه به‌منظور حل مدل‌های مذکور از دو روش هوشمند ترکیبی بر مبن...

متن کامل

انتخاب دید جهت ذخیره‌سازی دید در پایگاه داده تحلیلی با استفاده از الگوریتم فرهنگی ترکیبی

پایگاه داده تحلیلی حجم زیادی از داده‌ها که در سیستم‌های تصمیم‌گیرنده و گزارش‌گیر مورد استفاده قرار می‌گیرد را ذخیره می‌کند. در این سیستم‌ها سرعت پاسخ‌گویی به پرس‌وجوها به علت حجم زیاد داده‌های ذخیره‌شده، پایین است. از آن‌جایی که این سیستم‌ها عموماً مورد استفاده مدیران ارشد در سازمان‌های مختلف هستند، درنتیجه افزایش سرعت در این سیستم‌ها حائز اهمیت است. یکی از روش‌های افزایش سرعت، ذخیره دیدها جهت پ...

متن کامل

انتخاب بهینه وب سرویس‌های مکانی در ترکیب سرویس‌ها با استفاده از کیفیت سرویس مکانی

یکی از مسائل قابل توجه و پراهمیت در سامانه‌های اطلاعات مکانی تعامل پذیری است. با ظهور فن‌آوری وب سرویس‌ها و الگوی معماری سرویس‌گرا در سامانه‌های اطلاعات مکانی، اشتراک داده‌های مکانی از روش کلاسیک و داده مبنا به روش توزیع پذیر و سست پیوند تبدیل شد. با افزایش درخواست کاربران برای اطلاعات مکانی، سازمان‌ها و افراد زیادی با توجه به استانداردهای اطلاعات مکانی (استاندارد OGC)، سرویس‌های مکانی خود را ا...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


عنوان ژورنال

دوره 15  شماره 4

صفحات  17- 30

تاریخ انتشار 2019-03

با دنبال کردن یک ژورنال هنگامی که شماره جدید این ژورنال منتشر می شود به شما از طریق ایمیل اطلاع داده می شود.

کلمات کلیدی

کلمات کلیدی برای این مقاله ارائه نشده است

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023